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Beschreibung 



Die Erfindung betrifft das oberbegrif f lich Beanspruchte und 
20 befalit sich somit mit Vorrichtungen und Verfahren zur Verbes- 
serung des Transfers von Daten innerhalb von mehrdimensiona- 
len Anordnungen von Sendern und Empfangern. 

Es sind bereits multidimensionale Felder aus datenverarbei- 
25 tenden Zellen bekannt. Zur Gattung dieser Bausteine zShlen 

insbesondere systolische Arrays, neuronale Netze, Mehrprozes- 
sor Systeme, Prozessoren mit mehreren Rechenwerken und/oder 
logischen Zellen und/oder koromunikativen/peripheren Zellen 
(10), Vernetzungs- und Netzwerkbausteine wie z.B. Crossbar- 
30 Schalter/ ebenso wie bekannte Bausteine der Gattung FPGA, 

DPGA, Chameleon, XPUTER, etc.. Es sind insbesondere Bausteine 
bekannt, bei denen erste Zellen wahrend der Laufzeit ohne 
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Storung des Betriebes weiterer Zellen uinkonf igurierbar sind, 
vgl. etwa die folgenden Schutzrechte und Anmeldungen dessel- 
benAnmelders: P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 
483.2, DE 196 54 846.2-53, DE 196 54 593.5-53, 
DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33,- 
DE 100 28 397.7, DE 101 10 530,4, DE 101 11 014.6, 
PCT/EP 00/10516, EP 01 102 674.7. Diese sind hiermit zu Of- 
fenbarungszwecken vollumf anglich eingegliedert . Hingewiesen 
wird welter auf die Chameleon-Systems-Prozessor-Architektur . 
Die Brauchbarkeit der letztgenannten Konstruktion zu Daten- 
verarbeitungszwecken ist jedoch eher vergleichbar mit einer 
Anordnung gemSli DE 101 03 624 Al. 

Die Zellen kdnnen nun unterschiedlichen Funktionen ausfUhren, 
etwa Bool^sche VerknUpfungen von Eingangs-Operanden bewirken, 

Zwischen ihnen verlaufen Verbindungen, die gleichfalls ein- 
stellbar sind, typisch etwa Busse, die auf verschiedene Weise 
eine Vernetzung bewirken kbnnen und so ein in seiner Vernet- 
zung einstellbares multidiraensionales Feld aufbauen. OBer die 
Busse Oder anderen Leitungen tauschen die Zellen miteinander 
wie erforderlich Inf ormationen aust, etwa Statussignale, 
Trigger oder die zu verarbeitenden Daten. Typisch sind dabei 
in einem zweidimensionalen Prozessorf eld etwa die Zellen Rei- 
hen- und spaltenweise angeordnet, wobei die AusgSnge von Zel- 
len einer ersten Reihe auf Busse gefiihrt, an die zugleich die 
Eingange der Zellen der nSchsten Reihe zu koppeln sind. Bei 
einer bekannten Anordnung (Pact XPP) sind zudem Vorwarts- und 
RQckwartsregister vorgesehen, urn Daten unter Umgehung von 
Zellen auf Bussysteme anderer Reihen zu leiten, ein Balancing 
von parallel auszufuhrenden Zweigen zu erreichen, usw. Es ist 
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auch schon vorgeschlagen worden, derartige Vor- und/oder 
Rttckwartsregister mit einer Uber den reinen Datentransf er 
hinausgehenden Funktionalitat zu versehen. 

Um eine bestimmte Art der Datenverarbeitung durchzuf^ihren; 
mufi jeder Zelle eine bestimmte Funktion zugewiesen werden und 
es ist eine geeignete Vernetzung vorzusehen. Esmufi dazu, be- 
vor das multidimensionale Prozessorf eld Daten wie gewtoscht 
verarbeitet, festgelegt werden, welche Zelle welche Funktion 
ausfiihren soli, es ist fUr jede an einer Datenverarbeitungs- 
aufgabe beteiligen Zelle eine Funktion festzulegen und es muli 
die Vernetzung bestimmt werden. Dabei ist es wiinschenswert, 
die Funktion und Vernetzung so zu wahlen, dafi. die Datenverar- 
beitung moglichst ziigig erfolgen kann. Oftmals ist es jedoch 
nicht mOglich, eine Konf iguration zu finden, die den ge- 
wunschten Datentransf er in optimaler Weise gewShrleistet . Es 
mUssen dann suboptimale Konf igurationen verwendet werden. 

Wiinschenswert ist es, eine Moglichkeit zu schaffen, die Kon- 
f igurierbarkeit zu erleichtern. 

Die Aufgabe der vorliegenden Erfndung besteht darin, Neues 
fur die gewerbliche Anwendung bereitzustellen. 

Die Ldsung der Aufgabe wird unabhSngig beansprucht. Bevorzug- 
te Ausfahrungsformen befinden sich in den UnteransprUchen. 

Es wird damit zunSchst vorgeschlagen, dafibei einem multidi- 
mensionalen Prozessorfeld aufweisend 

eine Vielzahl benachbart angeordneter Datenverarbeitungszel- 
len mit EingSngen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-Verknapfungseinheit, die diese entsprechend 
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der jeweiligen Funktion ihrer Operanden-Verkniipfungseinheit 
verkntlpfen und AusgSngen, um die Daten verkntipft auf Vernet- 
zungswege aufzugeben, vorgesehen ist, daB die Datenverarbei- 
tungszellen ein AspektverhSltnis aufweisen, das wenigstens 
5 1,5:1, bevorzugt 2:1 betragt. 

Damit wird eine wesentliche Verbesserung der Verkntipfbarkeit 
erreicht, ohne daB teuere Siliziumf ISche far zusStzliche Bus- 
verbindungen bereitgestellt werden muB oder eine besodners 
10 komplexe Topologie gewShlt werden muB. Die Verbesserungen der 
Verbindbarkeit ergeben sich vielmehr allein daraus, dafi der 
Datentransfer quer zu den Zellen verktirzt wird und damit Da- 
ten innnerhalb kUrzerer Zeiten, bezogen auf die zum durch- 
stremen bzw. Verarbeiten in der Zelle erf orderlichen Zeiten 
15 selbst, von Zelle zu Zelle gelangen. Damit wachst die Anzahl 
der noch als nachste Nachbarn zu bezeichnenden Zellen, die 
also noch innerhalb eines Taktes zu erreichen sind. Es ergibt 
sich etwa bei zweidimensionalen Feldern eine Anordnung, bei 
der eine Zelle funktional mehr nSchste Nachbarn besitzt, als 
sich topologisch bei reiner Geometriebetrachtung im zweidi- 
mensionalen Fall ergibt. Mit andern Worten ergibt sich nur 
durch die VerSnderung des Aspektverhaitnisses funktional eine 
mehr als zweidimensionale Konnektivitat . 

25 Bei den Zellen wird es sich insbesondere um PAE-Zellen mit 
EALU handeln, wie sie per se aus dem vorzitierten Stand der 
Technik bekannt sind. Bei solchen Zellen wird es sich wie be- 
vorzugt um grobgranular konf igurierbare Zellen handeln. 

30 Es ist moglichund bevorzugt, wenn die Datenverarbeitungszel- 
len in Reihen und Spalten angeordnet sind. Dies erlaubt eine 
besonders ganstige Auslegung der Zellen, die typisch nahe- 
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rungsweise trapezf Ormig bzw. rechteckig sind, Es kann dann 
vorgesehen sein, dafi zumindest bei einem Teil der Datenverar- 
beitungszellen DateneingSnge vorgesehen sind, um von einer 
oberen Reihe Daten zu erhalten und Datenausgange, um an eine 
5 untere Relhe Daten auszugeben. In einem solchen Fall ergibt 
sich die verbesserte Konnektivitat in beiden Reihen. 

Typisch wird es sich um ein Prozessorf eld handeln, bei dem 
die Datenverarbeitungseinheiten EALUs, ALU und/oder register- 
10 flankierte Zellen sind, d.h. es werden zur Verbindung unter- 
schiedlicher Reihen typisch neben den datenverarbeitenden und 
dabei Daten verz5gerungsf rei, d.h. etwa schnellstmoglich wei- 
terleitenden Zellen noch Register vorhanden sein, die gerade 
dazu dienen, Daten bei der Weiterleitung zu verzagern, sei 
15 es, um unkontrollierte RUckkopplungsschleif en zu verhindern 
bzw, unterbrechen {Prinzip der sog. Annihilated Feedback Loop 
Termination- sog, AFTER-Zellen) oder bei datenauf spaltendem 
Durchlaufen von Zweigen und nachf olgendem Wiedervereinigen 
einen zeitlichen Gleichlauf zu erzwingen (Balancing) . 

20 

Mit einem solchen Prozessorf eld ist es nun moglich, eine Kon- 
figuration derart zu wahlen, dali, wenn Zellen fur die Konfi- 
guration ausgewahlt und in Funktion und Vernetzung bestimmt 
werden, wobei eine Vernetzung derart bestimmt wird, dali Daten 
25 von Zelle zu Zelle zumindest weitgehend verzogerungsf rei 

abertragbar sind, vorgesehen ist, dafi als benachbarte Zellen, 
zwischen denen Daten binnen eines Taktes oder einer geringen 
Taktzahl Qbertragbar sind, auch solche berUcksichtigt werden, 
die nicht unmittelbar nebeneinander liegen, sondern in der 
30 Breite durch eine Strecke getrennt sind, die geringer ist als 
die Lange der Zelle. 



- 5 - 



10 



Akte: PACT 3 6 



Es sei darauf hingewiesen, dafi das angegebene minimale 
Aspektverhaitnis das wenigstens 1,5:1 betrSgt, bevorzugt noch 
grSBerei. Werte annimmt und sich bei sorgfaitiger Auslegung der 
Einheiten durchaus im Bereich zwischen 5:1 und 10:1 bewegen 
kann . 

Die Erfindung wird im folgenden anhand der Zeichnung be- 
schrieben, worin gezeigt ist durch 

Fig. 1 ein Prozessorf eld der vorliegenden Erfindung 



Nach Fig. 1 umfalit ein allgeraein mit 1 bezeichnetes Prozes- 
sorfeld 1 eine Vielzahl benachbart angeordneter Datenverar- 
15 beitungszellen 2 mit EingSngen 3, die Daten von Vernetzungs- 
wegen 4 erhalten, einer Operanden-VerknUpf ungseinheit 5, die 
diese entsprechend der jeweiligen Funktion ihrer Operanden- 
Verkntipfungseinheit 5 verknUpfen und Ausgangen 6, urn die Da- 
ten verknapft auf Vernetzungswege 4 aufzugeben, wobei die Da- 
20 tenverarbeitungszellen bzw. ihre datendurchf lossene Operan- 
den-Verkntipfungseinheit 5 ein Aspektverhaitnis von Lange zu 
Breite aufweisen, das grSJier ist als 2:1 betragt. 

Bei dem Prozessorf eld 1 handelt es sich vorliegend urn eine 
25 per se als XPP bekannte Anordnung; alternativ kann es als ein 
Array aus zur Laufzeit partiell rekonf igurierbaren Elementen 
angeordnet sein kSnnen, etwa als Prozessor, Koprozessor, DSP, 
usw.. Das Prozesssorfeld ist im dargestellten Fall aus 3 Rei- 
hen und 4 Spalten aufgebaut, aber nur aus Grunden der Ober- 
30 sichtlichkeit so vergleichsweise klein gewahlt. Typisch wird 
es grofier ausgelegt werden. 
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Die Datenverarbeitungszellen 2 sind grobgranular konfigurier- 
bar und weisen f eingranulare Statemachines auf . Sie sind auf 
per se bekannte Weise rekonf igurierbar, ohne den Betrieb zu 
stSren. Auf die hier realisierte, aber nicht naher zu erl^u- 
ternde MGglichkeit der zentralen Konf igurationsvorgabe etwa 
durch einen Konf igurationsmanager, der Waverekonf iguration 
etc. sei hingewiesen. Die Zellen enthalten als Operanden- 
VerknUpfungseinheit 5 eine ALU-Einheit;. in der arithmetische 
Operationen wie Addition, Multiplikation, Subtraktion und Di- 
vision an bis zu drei eingehenden Operanden durchgefuhrt wer- 
den konnen, sowie Verknupf ungen wie ISTgroBer? ISTkleiner? 
IStNUll? sowie XOR, OR, AND NAND etc. Die ALU-Einheit ist 
mittig angeordnet und flankiert von einem Vorwarts- und einem 
Rtickwartsregister, die in per se bekannter Weise Uber die An- 
schlusse der Datenverarbeitungszelle 2 gleichfalls mit den 
Vernetzungswegen 4 verbunden werden kSnnen. 

Die Datenein- und ausgange 3 bzw 6 sind tiber Multiplexer mit 
den Verbindungswegen 4 verbunden, Es ist im vorliegenden Fall 
ein Bussystem mit einer Vielzahl von Leitungen vorgesehen, um 
die Zellen in den Reihen und Spalten konf igurierbar itiiteinan- 
der zu vernetzen. 

Das Aspektverhaltnis der ALU-Einheit betragt nun im darge- 
stellten Beispiel 6:1, d.h. die Zelle ist sehr viel langer 
als breit. 

Die Anordnung wird nun verwendet wie folgt: 

Es wird zunachst ein Prograram zur AusfUhrung auf dem Array 1 
ausgewahlt. Dann wird mit per se bekannten Mitteln eine Kon- 
figuration bestimmt, die einen optimalen Daten-Durchsatz er- 



Akte: PACT36 



laubt. Hierbei wird nun berUcksichtigt , dafi Daten auch an 
Zellen, die nicht unmittelbar in der Reihe darunter oder 
seitlibh neben einer gegebenen Zelle liegen, sondern z.B. 
drei Spalten seitlich versetzt sind, innerhalb eines Verar- 
beitungs-Taktes Daten erhalten kSnnen, ohne dafi groBere Ver- 
zagerungen auftreten. Die unter BerUcksichtigung dieser er- 
weiterten Nachste-Nachbar-Def inition erhaltene Konf iguration 
wird auf das Array auf konf iguriert und ausgefahrt. 
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Patent ansprtiche 

1. Multidimensionales Prozessorf eld aufweisend 

eine Vielzahl benachbart angeordneter Datenverarbei- 

20 tungszellen mit 

Eingangen, die Daten von Vernetzungswegen erhalten, 
einer Operanden-VerknUpfungseinheit, die diese ent- 
sprechend der jeweiligen Funktion ihrer Operanden- 
Verkniipfungseinheit verkntipfen und 
25 Ausgangen, urn die Daten verkntipft auf Vernetzungs- 

wege aufzugeben, 

dadurch gekennzeichnet, dali 
die Dateriverarbeitungszellen ein Aspektverhaltnis auf- 
weisen, das wenigstens 2:1, bevorzugt 2:1 betrSgt. 
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Multidimensionales Prozessorf eld nach dem vorhergehenden 
Anspruch, dadurch gekennzeichnet, dafi die Datenverarbei- 
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tungszellen als grobgranular konf igurierbare Zellen aus- 
gebildet sind. 

Multidimensionales Prozessorf eld nach einem der vorher- 
gehenden Ansprttche, dadurch gekennzeichnet , daB Daten- 
verarbeitungszellen in Reihen und Spalten angeordnet 
sind. 

Prozessorfeld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, daft zumindest bei einem Teil der Daten- 
verarbeitungszellen Dateneingange vorgesehen sind, um 
von einer oberen Reihe Daten zu erhalten und Datenaus- 
gange, um an eine untere Reihe Daten auszugeben. 

Prozessorfeld nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi die Datenverarbeitungseinheiten EA- 
LUs, ALU und/oder registerf lankierte Zellen sind. 

Verfahren zur Konf igurierung eines Prozessorf eldes nach 
einem der vorhergehenden AnsprQche, worin Zellen fUr die 
Konfiguration ausgewahlt und in Funktion und Vernetzung 
bestimmt werden, wobei eine Vernetzung derart bestimmt 
wird, dafi Daten von Zelle zu Zelle zumindest weitgehend 
verzagerungsfrei iibertragbar sind, dadurch gekennzeich- 
net, dali als benachbarte Zellen, zwischen denen Daten 
binnen eines Taktes oder einer geringen Taktzahl Uber- 
tragbar sind, auch solche beriicksichtigt werden, die 
nicht unmittelbar nebeneinander liegen, sondern in der 
Breite durch eine Strecke getrennt sind, die geringer 
ist als die LSnge der Zelle. 
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